Dans ce projet, nous avons essayé de prédire un problème de classification dans un ensemble de données sur les accidents vasculaires cérébraux par une variété de modèles pour classifier les prédictions d'accidents vasculaires cérébraux dans le contexte de déterminer si quelqu'un est susceptible d'avoir un accident vasculaire cérébral en fonction des paramètres d'entrée comme le sexe, l'âge et divers résultats de test ou non. Nous avons analysé en détail la cible et les caractéristiques. Nous avons transformé les variables catégorielles en nombres entiers en utilisant Label Encoder, afin de pouvoir les utiliser dans les modèles. Nous avons vérifié les modèles obtenus à partir des ensembles de formation en appliquant une validation croisée pour chaque performance de modèle. Enfin, nous avons examiné visuellement les résultats de tous les modèles afin de sélectionner le meilleur pour le problème en question. En vérifiant tous les scores comme F1_score, Precision, Recall et Accuracy, XGBoost et Naive Bayes donnent les meilleurs résultats en comparaison avec les autres modèles. Pour les ensembles de données respectifs, XGBoost et Naive Bayes sont les meilleurs modèles pour les prédictions futures.

Les résultat sont les mèmes pour les deux modèles donc on peut dire que les trois personnes sont en bonne senté.